——————【 正则表达式 】——————

  • 复习字符串操作

indexOf 查找字符 返回位置
charAt  查找位置 返回字符
substring 获取字符窜
split     分割字符串
  • 正则表达式的概念和写法

正则 :也叫做规则,让计算机能够读懂人类的规则
正则都是操作字符串的。
正则的写法:
var re = /a/; //和数组字符串区分开来
var re = newRegExp('a');

【正则默认】 :

1.正则中是区分大小写的
不区分大小写在正则后加 表示i (ignore)
如var re = newRegExp('a','i');
2.正则匹配成功就会结束,不会继续匹配,
如果想全部查找就要加 标识g (global)
  • 量词:代表出现的次数

量词        描述
n+            匹配任何包含至少一个 n 的字符串。
n*            匹配任何包含零个或多个 n 的字符串。
n?            匹配任何包含零个或一个 n 的字符串。
n{X}        匹配包含 X 个 n 的序列的字符串。
n{X,Y}          匹配包含 X 至 Y 个 n 的序列的字符串。
n{X,}            匹配包含至少 X 个 n 的序列的字符串。
n$            匹配任何结尾为 n 的字符串。
^n            匹配任何开头为 n 的字符串。
?=n            匹配任何其后紧接指定字符串 n 的字符串。
?!n            匹配任何其后没有紧接指定字符串 n 的字符串。
>{n,m}:至少出现n次,最多m次
>{n,} :至少n次
>* :任意次 相当于{0,}
? :零次或一次 相当于{0,1}
+ :一次或任意次相当于 {1,}
{n}: 正好n次
例子:判断是不是QQ号

//^ : 放在正则的最开始位置,就代表起始的意思,注意 /[^a] / 和

/^[a]/是不一样的,前者是排除的意思,后者是代表首位。

//$ : 正则的最后位置 , 就代表结束的意思

//首先想QQ号的规则 
1 首位不能是0
2 必须是 5-12位的数字
var aInput = document.getElementsByTagName('input');

var re = /^[1-9]\d{4,11}$/;

//123456abc为了防止出现这样的情况,所以必须限制最后

//首位是0-9,接着是4-11位的数字类型。

aInput[1].onclick = function(){

    if( re.test(aInput[0].value) ){

        alert('是QQ号');
    
    }else{
    
        alert('不是QQ号');

    }
};

例子:去掉前后空格(面试题经常出现)

var str = ' hello ';

    alert( '('+trim(str)+')' );//为了看出区别所以加的括号。 (hello)
    
function trim(str){

var re = /^\s+|\s+$/g; // |代表或者 \s代表空格 +至少一个 前面有至少一个空格 或者后面有至少一个空格 且全局匹配

return str.replace(re,''); //把空格替换成空

}
  • 贪婪模式与反贪婪模式

*、+和?限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可>以实现非贪婪或最小匹配。


var c="qqq icbkb coiwcnk tyu kjanc alnc"

var reg =/\w{4,7}/g

    console.log(c.match(reg))// ["icbkb", "coiwcnk", "kjanc", "alnc"]

var reg =/\w{4,7}?/g

    console.log(c.match(reg)) ["icbk", "coiw", "kjan", "alnc"]
    
  • 正则表达式边界及前瞻

  • 边界
  • 整个字符串开头( ^ ) 结尾( $ )
  • 单词的边界 (b), (B)
  • 前瞻
  • 正向前瞻 reg (? = assert)
  • 反向前瞻 reg (?! = assert)
  • 正则的对象属性

属性 描述

global RegExp 对象是否具有标志 g。

ignoreCase RegExp 对象是否具有标志 i。

lastIndex 一个整数,标示开始下一次匹配的字符位置。

multiline RegExp 对象是否具有标志 m。

source 正则表达式的源文本。

  • 正则表达式的使用

  • RegExp 对象方法

方法 描述

compile 编译正则表达式。
exec 检索字符串中指定的值。返回找到的值,并确定其位置。

test 检索字符串中指定的值。返回 true 或 false。

  • 支持正则表达式的 String 对象的方法

方法 描述

search 检索与正则表达式相匹配的值。
match 找到一个或多个正则表达式的匹配。
replace 替换与正则表达式匹配的子串。
split 把字符串分割为字符串数组。
  • test() :在字符串中查找符合正则的内容,若查找到返回true,反之返回false.

用法正则.test(字符串)
例子:判断是否是数字

var str = '374829348791';
    
var re = /\D/; // \D代表非数字
    
    if( re.test(str) ){ // 返回true,代表在字符串中找到了非数字。

        alert('不全是数字');
    
        }else{
    
        alert('全是数字');
    }
  • search() :在字符串搜索符合正则的内容,搜索到就返回出现的位置(从0开始,如果匹配的不只是一个字母,那只会返回第一个字母的位置), 如果搜索失败就返回 -1

用法:字符串.search(正则)
在字符串中查找复合正则的内容。忽略大小写:i——ignore(正则中默认是区分大小写的 如果不区分大小写的话,在正则的最后加标识 i )

例子:在字符串中找字母b,且不区分大小写


var str = 'abcdef';
var re = /B/i;
//var re = new RegExp('B','i'); 也可以这样写
alert( str.search(re) ); // 1
  • match() 在字符串中搜索复合规则的内容,搜索成功就返回内容,格式为数组,失败就返回null。

用法: 字符串.match(正则)
量词:+ 至少出现一次 匹配不确定的次数(匹配就是搜索查找的意思)
全局匹配:g——global(正则中默认,只要搜索到复合规则的内容就会结束搜索 )

例子:找出指定格式的所有数字,如下找到 123,54,33,879


var str = 'haj123sdk54hask33dkhalsd879';

var re = /\d+/g; // 每次匹配至少一个数字 且全局匹配

如果不是全局匹配,当找到数字123,它就会停止了。

就只会弹出123.加上全局匹配,就会从开始到结束一直去搜索符合规则的。

如果没有加号,匹配的结果就是1,2,3,5,4,3,3,879并不是我们想要的,有了加号,每次匹配的数字就是至少一个了。

alert( str.match(re) ); // [123,54,33,879]
  • replace() :查找符合正则的字符串,就替换成对应的字符串。返回替换后的内容。

用法: 字符串.replace(正则,新的字符串/回调函数)(在回调函数中,第一个参数指的是每次匹配成功的字符)
| : 或的意思 。

例子:敏感词过滤,比如 >我爱北京天安门,天安门上太阳升。------我爱*,上太阳升。即北京和天安门变成*号,
一开始我们可能会想到这样的方法:

var str = "我爱北京天安门,天安门上太阳升。";

var re = /北京|天安门/g;     // 找到北京 或者天安门 全局匹配

var str2 = str.replace(re,'*'); 

alert(str2)                 //我爱**,*上太阳升 

//这种只是把找到的变成了一个*,并不能几个字就对应几个*。

要想实现几个字对应几个*,我们可以用回调函数实现:

var str = "我爱北京天安门,天安门上太阳升。";

var re = /北京|天安门/g;        // 找到北京 或者天安门 全局匹配

var str2 = str.replace(re,function(str){

alert(str);         //用来测试:函数的第一个参数代表每次搜索到的符合正则的字符,所以第一次str指的是北京 第二次str是天安门 第三次str是天安门

var result = '';

for(var i=0;i<str.length;i++){

result += '*';

} 
return result;   //所以搜索到了几个字就返回几个* 

});

alert(str2)     //我爱*****,***上太阳升

//整个过程就是,找到北京,替换成了两个*,找到天安门替换成了3个*,找到天安门替换成3个*。
replace是一个很有用的方法,经常会用到。
  • ():,小括号,叫做分组符。就相当于数学里面的括号。如下:


var str = '2013-6-7';

var re1 = /\d-+/g;           // 全局匹配数字,横杠,横杠数量至少为1,匹配结果为: 3- 6-

var re1 = /(\d-)+/g;        // 全局匹配数字,横杠,数字和横杠整体数量至少为1 3-6-

var re2 = /(\d+)(-)/g;      // 全局匹配至少一个数字,匹配一个横杠 匹配结果:2013- 6-
  • [] : 表示某个集合中的任意一个,比如 [abc] 整体代表一个字符 匹配 a b c 中的任意一个,也可以是范围,[0-9] 范围必须从小到大 。

1 整体代表一个字符 :^写在[]里面的话,就代表排除的意思

例子:匹配HTML标签 比如<div class="b">hahahah </div> 找出标签<div class="b"></div>

var re = /<2+>/g; //匹配左括号

中间至少一个非右括号的内容(因为标签里面还有属性等一些东西),然后匹配右括号

var re = /<[wW]+>/g; //匹配左括号 中间至少一个字符或者非字符的内容,然后匹配右括号//

其实就是找到左括号,然后中间可以有至少一个内容,一直到找到右括号就代表是一个标签。

  • 概念理解

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这>>些特定字符>的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一>>种过滤逻辑。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:

  1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
  2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。

正则表达式的特点是:

  1. 灵活性、逻辑性和功能性非常强;
  2. 可以迅速地用极简单的方式达到字符串的复杂控制。

  1. a
  2. >

搜狗搜到你
533 声望31 粉丝

“工欲善其事,必先利其器”。 思考、书籍和社会实践使我不断走向成熟,对知识的渴望,对理想的追求,人际关系的扩展,思维方式的变更,造就了我不断完善的专业技能和日趋成熟的思想,培养了我务实进取、认真负责的...